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摘要 : [目的 /意义 ] 网 络 信息 污染 已 经 为 广大 人 民 群 众 所 深 恶 痛 绝 ， 对 网 络 信息 污染 状况 做 出 科学 的 
评价 ， 将 此 问题 置 于 公众 的 监督 之 下 ， 有 助 于 提升 解决 问题 的 效率 。[ 方 法 / 过程] 本文 结合 12321 中 心 
数据 和 公众 问卷 调研 数据 ， 运 用 模糊 语言 改进 的 “ 拉 开 档次 ”方法 确定 指标 权重 ， 使 用 TOPSIS 方法 集结 
评价 信息 。 [结果 /结论 ]2014 年 2 月 至 2016 年 10 月 期 间 ， 网 络 信息 污染 整体 状况 形势 较为 严峻 ， 尤 以 
2015 年 3、4 月 时 段 信 息 污 染 最 为 严重 。 本 文 基 于 模糊 语言 的 改进 “ 拉 开 档次 ”方法 相 比 传统 “ 拉 开 档次 ” 


方法 ， 具 有 更 好 的 评价 单元 区 分 能 力 。 
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互联 网 是 一 把 双 刃 剑 ， 在 带 给 人 们 便利 
的 同时 也 带 来 了 网 络 信息 污染 现象 ， 如 垃圾 短 
信 、 骚 扰 电 话 、 垃 圾 邮件 等 ， 造 成 了 许多 负面 
的 影响 。12321 互联 网 不 良 与 垃圾 信息 举报 中 心 
(以 下 简称 12321 中 心 ) 数据 显示 ， 最 近 一 年 
我 国 网 民 因 为 网 络 信 息 污染 所 章 受 的 经 济 损失 
高 达 915 亿 元 人 民 币 ， 几 乎 接近 2015 年 西藏 地 
区 全 年 的 GDP 总 和 (2015 年 西藏 地 区 GDP 总 
和 为 1 026 亿 元 ) ;给 全 体 网 民 造 成 的 时 间 损 失 
相当 于 3 822 人 的 生命 (2015 年 世界 卫生 组 织 
报告 中 国人 均 寿命 ， 男 性 74 岁 ,女性 77 岁 ， 按 


4 


平均 寿命 75 岁 计 算 ) 。 那 么 ， 当 前 网 络 信息 污 
染 状 况 到 底 呈 现 怎样 的 状态 ? 公众 对 网 络 信息 
污染 的 认 知 与 中 心 统计 数据 是 否 一 致 * 如 何 对 
网 络 空间 中 的 信息 污染 状况 进行 科学 评价 ? 通 
过 回答 这 些 问题 ， 并 将 网 络 信息 污染 问题 置 于 
公众 的 监督 之 下 ， 有 助 于 营造 天气 清 衣 、 生 态 
良好 ”的 网 络 空间 环境 。 

信息 污染 一 词 由 德国 学 者 拉 斐 尔 普 罗 在 论 
文 《 信 息 生态 学 进展 》 中 首次 提出 "。 信 息 污染 
主要 包含 两 类 : 一 是 媒介 信息 中 混和 人 的 有 害 、 有 
毒 、 具 有 欺骗 性 和 误导 性 的 信息 ， 二 是 过 载 信 
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KA= 
息 名 ， 这 些 污 染 信 息 可 能 会 导致 人 们 隐私 的 泄 
漏 以 及 时 间 、 金 钱 和 精神 层面 的 损失 。 随 着 大 
数据 、 云 计算 、 移 动 互联 网 等 新 兴 信 息 技术 的 
应 用 ， 信 息 污染 已 经 成 为 网 络 治 理 和 盟 论 引导 
人 研究 领域 的 热点 问题 趾 。 现 有 研究 主要 从 以 下 
两 个 方面 展开 。 

一 方面 是 对 信息 过 载 问 题 及 其 解决 方案 的 
研究。 信息 过 载 是 指 人 们 接受 了 过 多 信息 ， 但 
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风险 评 佑 方面 的 研究 。 夏 日 首次 提出 了 信息 污染 
指数 Cinformation pollution index, PDJ", 并 
建立 了 一 套 指 标 体系 "7 7， 但 他 对 信息 污染 源 
的 划分 包括 实物 型 、 文 献 型 ` 电子 型 和 网 络 型 , 指 
标 包 含 过 多 宛 余 信 息 ， 已 经 不 符合 网 络 社会 的 
实际 情况 。 程 艳 林 提 出 了 网 络 信息 污染 检测 的 7 
个 维度 中， 但 没有 给 出 具体 的 量化 方法 。 谢 友 
宁 和 钮 钦 调研 了 农民 生活 中 存在 的 生活 型 和 生 


却 无 法 有 效 整 合 、 组 织 及 内 化 成 自己 需要 的 信 
息 ， 以 致 影响 到 工作 、 学 习 和 人 际 关系 中。M. 
J. Eppler 等 将 信息 过 载 产 生 的 原因 分 为 个 人 因 
素 、 信 息 特 质 、 任 务 及 过 程 因素 、 组 织 设计 及 
言 息 科 技 五 大 类 别 品 。 何 仲 等 认为 信息 过 载 问 
题 在 网 络 购物 环境 中 会 让 消费 者 选择 困难 ， 造 
成 消费 者 时 间 和 心理 上 的 成 本 浪费 中 。 王 娜 和 
郑 巧 伟 研 究 微 信 订 阅 服务 中 出 现 的 信息 过 载 现 
B, 发 现 当 前 微 信 订 阅 服 务 的 内 容 存 在 重复 、 低 
质 等 问题 中。 那么 信息 过 载 问题 如 何 解决 呢 ? 
大 多 数学 者 选择 从 技术 角度 降低 数据 维度 ， 帮 
助 用 户 获取 有 用 信息 ， 主 要 包括 个 性 化 推荐 算 
法 和 搜索 引擎 技术 。 梁 劳 意 从 信息 组 织 者 出 
发 ， 认 为 图 书馆 应 该 通过 对 用 户 开 展 信息 素质 教 
育 、 制 订 咨 询 手 册 等 措施 帮助 用 户 避 免 信 息 过 
载 现象 上 。 王 娜 等 对 泛 在 网 络 中 的 信息 过 载 问 
题 进行 了 抽样 调查 和 分 析 ， 并 提出 了 在 移动 社 
交 网 站 中 建立 个 性 化 推荐 的 机 制 。 王 娜 和 田 


产 型 信息 污染 2， 但 存在 主观 性 过 强 的 缺点 。 
陈 桂香 则 调研 了 大 学 生 遭 遇 信息 污染 现状 及 态 
度 中， 但 仅 限于 对 结果 的 统计 描述 。T. H. HSU 
等 运用 ANP 方 法 对 旅游 网 站 进行 了 评估 , 发 现 安 
全 "是 人 们 最 关注 的 问题 外。 朱 光 等 基于 信息 系 
统 的 安全 模型 中， 将 隐私 风险 因素 分 为 平台 脆 
弱 因 素 、 用 户 行为 脆弱 因素 和 外 部 威胁 因素 ， 构 
建 了 社交 网 络 隐私 风险 评估 体系 ， 并 用 模糊 评 
价 方法 进行 评价 P. 

通过 对 信息 污染 相关 研究 的 总 结 ， 发 现 
当前 的 研究 主要 聚焦 于 技术 层面 。 实 际 上 信息 
污染 的 源头 是 人 类 自身 。 随 着 移动 互联 网 的 普 
及 ， 信 息 污 染 的 影响 范围 也 逐步 扩大 ， 但 互联 
网 信息 污染 防治 是 一 个 社会 软 系统 问题 ， 具 有 
模糊 性 、 复 杂 性 、 系 统 性 等 特点 外， 因此 从 
技术 角度 无 法 从 本 质 上 解决 问题 。 社 会 学 研究 
表明 ， 将 问题 置 于 公众 的 评价 之 下 有 助 于 提升 
人 们 解决 问题 的 效率 ， 故 从 公众 角度 研究 信息 


晓 蒙 研究 了 豆瓣 社区 中 信息 的 组 织 设计 对 信息 
过 载 产生 的 影响 ， 并 针对 豆 锥 平台 提出 了 大 众 


污染 的 负面 影响 ， 对 于 警醒 人 类 反思 自身 的 信 
息 行为 ， 提 升 信息 素养 ， 共 同 维护 一 个 良好 的 


分 类 法 优化 方案 上。 王 又 然 基于 加 权 小 世界 网 
络 理论 ， 发 现 以 人 人 网 为 代表 的 社交 网 络 站 点 
中 单个 社 群 内 成 员 之 间 特 征 关 系 长 度 过 短 是 造 
成 该 类 平台 出 现 重复 率 高 、 同 质 化 高 的 原因 "”。 
高 锡 末 等 通过 从 知 网 搜索 关键 词 ， 建 立信 息 价 
值 评估 指标 体系 "。 赵 静 娴 将 在 线 评 论 分 为 非 
垃圾 评论 、 欺 骗 性 评论 、 干 扰 性 评论 和 低 效用 
评论 4 个 类 别 ， 建立 了 垃圾 评论 特征 属性 表 ， 并 
基于 神经 网 络 和 决策 树 方法 设计 了 在 线 评论 文 
本 分 类 方法 …。 

另 一 个 方面 是 对 网 络 信息 安全 和 个 人 隐私 


网 络 空间 环境 具有 重要 意义 。 在 信息 污染 及 其 
影响 评估 方面 ， 少 数学 者 进行 了 一 定 程 度 的 探 
索 ， 但 存在 指标 体系 过 于 宽泛 ， 不 符合 当前 网 
络 社会 实际 等 问题 。 

笔者 结合 12321 中 心 提供 的 信息 污染 及 垃 
圾 信息 统计 数据 和 公众 遭遇 信息 污染 的 态度 调 
查 问 卷 ， 运 用 基于 模糊 区 间 可 能 度 算法 构建 对 
称 和 矩阵 ， 并 基于 该 对 称 和 矩阵 获取 主观 权重 ， 再 
运用 ' 拉 开 档 次 ?法 进行 二 次 加 权 处 理 ， 对 传统 : 拉 
开 档 次 ’ 溉 ' 毫 无 主观 色彩 "的 权重 结果 进行 修正 。 
从 结果 对 比 来 看 ， 笔 者 设计 的 方法 可 以 较为 全 
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面 地 评价 网 络 信息 污染 状况 。 
@O 网 络 信 息 污染 伏 况 评价 指标 体系 构建 


言 息 污染 包含 两 大 类 污染 源 ， 但 考虑 到 信 
息 过 载 具 有 主观 性 强 的 特点 ， 不 同 的 人 有 不 同 
的 感受 ， 目 前 也 缺乏 相应 的 统计 支撑 。 故 笔者 
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^s fr RUSEDU E ie 28 UC, HZ X BC 
况 却 刚好 相反 。 因 此 ， 为 了 弥补 统计 数据 的 片 
面 性 缺点 , 借鉴 故障 检测 领域 失效 模式 及 影响 分 
析 (failure mode and effects analysis, FMEA) 方 
ik UU 中 采用 发 生 度 、 严 重度 和 检 出 度 对 失效 
模式 进行 风险 评 佑 ， 笔 者 针对 现 有 统计 的 7 种 


主要 针对 第 一 种 类 型 污染 信息 进行 研究 ， 暂 不 
考虑 第 二 类 信息 污染 。 

基于 前 期 研究 成 果 中 ， 笔 者 将 12321 中 心 
统计 类 目 作为 网 络 信息 污染 的 7 类 衡量 指标 ， 即 
垃圾 邮件 、 不 良 网 站 、 垃 圾 类 短信 、 涉 嫌 违 法 
类 短信 、 垃 圾 彩信 、 驭 扰 电话 和 手机 应 用 安全 
问题 CAPP) ， 这 是 目前 为 止 对 网 络 污染 信息 的 
最 为 详细 和 准确 的 统计 。 

同时 ， 在 前 期 调研 发 现 ，12321 中 心 的 统计 
数据 与 公众 的 感知 存在 较 大 的 差别 ， 例 如 恶意 
APP 在 统计 数据 中 大 量 存在 ， 其 至 超过 了 垃圾 


网 络 信息 污染 状况 评价 模型 


污染 信息 类 型 ， 设 计 了 《公众 遭遇 信息 污染 的 
态度 调查 》 问 卷 ， 从 公众 遭遇 信息 污染 的 频率 
《是否 经 常 遇 到 )、 已 对 公众 造成 的 危害 程度 〈 心 
理 伤害 、 时 间 浪 费 或 钱财 损失 ) 以 及 公众 对 各 
类 污染 信息 的 厌恶 程度 这 3 个 角度 进行 公众 认 
知 态度 调查 。 以 此 综合 考虑 统计 数据 和 公众 认 
知 态度 ， 全 面 评 价 网 络 信息 污染 状况 。 


O 网络 信息 污染 状况 评价 模型 与 方法 


在 建立 评价 指标 体系 之 后 ， 就 是 获取 指标 
权重 和 选择 信息 集结 方法 。 人 研究 路 线 如 图 1 所 示 。 


分 析 指 标 范围 


构建 指标 体系 


模糊 区 间 标 度 可 和 
度 矩 阵 P 


互补 判断 矩阵 权重 
计算 W 


对 123219 
信息 举 j 


TOPSIS 


研究 方法 


评价 模型 


图 1 网 络 信 息 污染 状况 评价 研究 路 线 
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2.1 基于 模糊 区 间 可 能 度 的 互补 矩阵 权重 获取 方 
法 

由 于 人 们 更 喜欢 使 用 语言 对 事物 进行 评 
判 ， 如 “ 优 “ 良 “中 “ 差 ”"， 而 人 类 语言 具有 模糊 
性 和 复杂 性 的 特点 ， 所 以 学 者 们 基于 模糊 数学 
提出 了 相应 的 权重 获取 方法 。 徐 译 水 提出 了 模 
糊 语 言 标 度 的 区 间 可 能 度 方法 中， 可 以 从 原始 
数据 中 获取 权重 。 笔 者 将 这 种 方法 应 用 于 评估 
矩阵 是 模糊 语言 的 情形 。 
2.1.1 模糊 语言 标 度 的 区 间 可 能 度 

定义 1 WHEE A = () ww， 若 有 0<ai €1l. 
则 称 和 矩阵 4 是 模糊 和 矩阵。 

定义 2 设 模糊 矩阵 4=(w)w， 若 有 
aj +a; =1， 则 称 矩 阵 4 是 模糊 互补 矩阵 。 

定义 3P99 Vra — [a ,a'], 5 -[b ,5"], 
定义 区 间 数 的 运算 法 则 : 

1) 间 数 的 加 法 : a+b=[a +b ,a*+b*]; 

2) 数 与 区 间 数 的 乘法 ，ha 2 [Aa ,ha*]， 其 
中 4>0; 

3) Xia «b ,a <b* ， 则 称 a<b。 

XE X, AP 设 区 间 数 a=[a ,a*],b=[5 , b], 
且 记 l=a -a,l-b'-b ， 记 a>b 的 可 能 度 
公式 如 公式 (1) 所 示 : 


p(azb)- maxi- maf” 


a 


一 Q wu" 
"m obo] 公式 (1) 


p(azb) H. 有 互补 性 ， 即 : 
0< p(azb)XlLlp(azb)-p(b2a)-l, 
2.1.2 基于 模糊 区 间 标 度 可 能 度 的 互补 判断 矩阵 
权重 获取 方法 

设 被 调研 对 象 deD， 其 中 
D-(d,.d,,--.,d,) 对 污染 信息 类 型 x 在 属性 
GeG={ 遭遇 信息 污染 的 频率 ， 已 受到 的 危害 程 
度 ， 对 信息 污染 的 厌恶 程度 } 下 的 模糊 语言 评 
佑 值 构成 的 矩阵 尺 = ono Ares, HP 

S={ 非常 低 , 有 点 低 , 一般, 比较 高 , 非常 高 
为 模糊 语言 标 度 ， 与 其 对 应 的 区 间 数 表达 式 进 
行 转换 P7); 

JE *f ff -[0,0.2], A zi 低 [0.2,0.4], 一 般 
=[0.4,0.6], 有 点 高 =[0.6,0.8], 非常 高 =[0.8,1] 基 
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于 模糊 区 间 标 度 可 能 度 的 主观 权重 的 过 程 如 下 : 

步骤 1: 对 所 有 调研 对 象 给 出 的 模糊 区 间 算 
ERAR (2) 集结 ， 其 中 通过 模糊 语言 标 度 
进行 转换 : 


1 


Ci 公式 加 
为 表达 方便 ， 集 结 后 的 模糊 区 间 抢 阵 仍 记 为 


R= Bus H 
步骤 2: 对 污染 信息 类 型 x 的 各 属性 值 进 
TRE, Lour 
TU gc» 
p= 


步骤 3: 利用 公式 (1) 对 ,i=1,2,…,n 进 
行 两 两 比较 得 可 能 度 矩 阵 已 = (py), ， 由 定义 可 
知 , 可 能 度 矩 阵 为 互补 判断 矩阵 , 根据 公式 (3) 计 
算 排 序 权重 Pn 


Q, = POET 5» da) =1,2,:…,n 公式 (3) 
22 运用 “ 拉 开 档次 ”法 进行 二 次 加 权 
在 郭 亚军 提出 的 “ 拉 开 档次 ”法 中 ， 评 价 指 
标的 权重 不 再 体现 指标 间 的 相对 重要 程度 ， 而 
是 将 各 指标 以 同等 “地 位 参与 "评价 过 程 ， 该 方 
法 “ 毫 无 主观 色彩 ”5 。 但 事实 上 ， 各 项 指标 相对 
于 评价 目标 的 重要 性 程度 往往 不 相等 。 因 此 ， 首 
先 利用 2.1 部 分 得 出 的 主观 权重 原始 数据 进行 加 
权 ， 然 后 再 采用 “ 拉 开 档次 法 ”二 次 加 权 。 计 算 
步 又 如 下 : 
步骤 d: 指标 一 致 化 和 无 量 纲 化 处 理 。 笔 者 
使 用 标准 差 标 准 化 处 理 方法 , 计算 如 公式 (4) 所 


1« E TM 
s 7 2,0 -X(U 52m) 分 别 为 样本 均 
值 和 标 沐 差 

步骤 2: 使 用 公式 G) 得 到 的 各 指标 权 
重 @,(i=1,2,…,n) 对 无 量 纲 化 后 的 (x;), 进行 
加 权 四。 为 表达 方便 ， 称 加 权 后 的 数据 仍 为 
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A= (Xs) os ; 
步骤 3: 运用 “ 拉 开 档次 法 ”进行 二 次 加 权 。 
首先 ,构造 实 对 称 和 矩阵 ， 如 公式 (5) 所 示 : 
H —- 4! A 公式 6) 
然后 ， 取 N H 的 最 大 特征 值 所 对 应 的 标 
WERE] SE, cot 即 为 所 求 权重 向 量 P9, 
2.3 运用 TOPSIS 方法 进行 信息 集结 
TOPSIS 方法 是 多 目标 决策 中 一 种 常用 
的 集结 评价 信息 的 方法 。 定义 被 评价 单元 
(Xj Xas Xm) 与 正 理想 单元 (Xi, 加 ,…,h,) 之 间 
的 加 权 欧 式 距离 为 : 


= (x) ,il 2 公式 (6) 
DETULIT 

想 单元 (0 a.) 间 的 加 权 欧 式 距离 为 : 
=$ o-i Lm ARO) 
定义 贴近 度 指标 为 


0 

y; 
Mod. js 
yr +y; 公式 (8) 


显然 ， 贴 近 度 方 越 大 越 好 ， 此 时 被 评价 单 
元 与 负 理想 单元 距离 较 大 ， 而 与 正 理想 单元 距 


人 
离 较 小 。 
16% 
6% 31% 
7% 
8% 32% 
国学 生 国 公 司职 员 国 个 体 户 
国教 师 m LA 国 其 他 
2 调研 对 象 职 业 分 布 图 
>50 小 时 
13% 
<10 小 时 
40-50 小 时 27% 
8% 
3040/5] | E 
6% | 
2030 小 时 | ~ 10-20 小 时 
20% 26% 


图 4 周 上 网 时 长 图 
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Q 网络 信息 污染 状况 评价 
3.1 公众 通过 信息 污染 的 态度 调查 

问卷 发 放 前 期 ， 对 问卷 内 容 经 过 反复 讨 
论 ， 修 改 问卷 题目 描述 。 在 此 基础 上 ， 经 过 30 
人 的 小 样本 发 放 ， 进 一 步调 整 问卷 表达 ， 确 保 
问卷 题目 清晰 明了 。 问 卷 共 包含 三 部 分 : 中 基 
本 信息 , 包括 性 别 、 年 龄 、 职 业 、 周 上 网 时 长 、 手 
机 系统 类 型 ， 思 主体 部 分 ， 共 21 EU O 
设置 开放 式 问 题 1 个 ， 即 “您 认为 还 有 哪些 信息 
也 属于 信息 污染 ? 它们 对 您 造成 了 什么 样 的 危 
害 ? ”在 2016 年 11 月 至 12 月 期 间 , 问卷 通过 ' 问 
卷 星 平台 和 重庆 地 区 人 和 群 最 为 集中 的 解放 碑 商 
圈 进 行 随机 发 放 。 

线 下 问卷 发 放 前 对 调查 员 进 行 了 必要 的 培 
训 。 在 问卷 发 放 过 程 中 ， 采 取 一 对 一 的 形式 ， 对 
问卷 填写 过 程 进行 指导 ， 使 其 能 按照 自身 真 
实情 况 填 写 ， 保 证 结果 的 可 靠 性 。 在 专家 指导 
下 ， 共 发 放 438 份 ， 收 回 有 效 问卷 417 份 ， 有 
效率 95.2%。 本 次 调查 涉及 的 被 调查 对 象 中 ， 男 
性 为 189 名 ， 占 比 45.3%， 女 性 为 228 名 ， 占 比 
54.7%。 被 调研 对 象 的 职业 、 年 龄 、 周 上 网 时 长 、 手 
机 系统 类 型 如 图 2- 图 5 所 示 : 


6%| 11^ 


16% 


30% 


47% 


单位 : 岁 
国 <=23 H24-35 m36-45 国 46-55 国 >=S06 


3 调研 对 象 年 龄 公布 


eu 
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12%| 2 
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5096 
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5 手机 系统 类 型 
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KA= 
在 线 问 卷 结 果 由 问卷 星 自动 统计 ， 无 缺失 
数据 ; 线 下 问卷 由 两 名 研究 员 使 用 EpiData3.1 软 
件 背 对 背 录 入 ， 以 降低 录入 错误 率 ， 此 部 分 问卷 
存在 部 分 缺失 数据 且 小 于 5%， 在 SPSS 中 采用 
最 大 期 望 值 (expectation maximization, EMO 方 
法 进行 补 齐 。 
3.2 问卷 信和 度 和 效 度 分 析 
3.2.1 信和 度 即 可 靠 度 
经 SPSS 计算 分 析 ，417 份 问卷 的 信和 度 水 平 
较 高 〈 大 于 0.7 为 高 信和 度 ) ， 满 足 探 索性 研究 的 
要 求 。 各 题 项 的 信 度 系数 如 表 1 所 示 。 


表 1 问卷 信 度 系数 


问卷 题 项 测量 题 项 ”删除 后 alpha alpha 
问卷 整体 信 度 0.925 
信息 污染 的 遵 Q1 0.827 
过 频率 Q2 0.812 
Q3 0.814 
Q4 0.804 0.839 
Q5 0.818 
Q6 0.825 
Q7 0.819 
童 息 污染 的 危 Q1 0.892 
害 程度 Q2 0.889 
Q3 0.892 
Q4 0.887 0.908 
Q5 0.894 
Q6 0.907 
Q7 0.897 
ESSEE UN Ql 0.894 
恶 程度 Q2 0.891 
Q3 0.899 
Q4 0.895 0.911 
Q5 0.896 
Q6 0.909 
Q7 0.896 


3.2.22 效 度 即 有 效 性 
常见 的 问卷 效 度 可 以 分 为 内 容 效 度 和 结构 
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效 度 ， 本 研究 所 使 用 问卷 的 内 容 效 度 经 5 名 专 
家 讨论 通过 。 结 构 效 度 要 求 各 维度 下 因子 具有 
一 致 性 ， 而 本 研究 中 所 使 用 的 问卷 是 要 测量 出 
公众 对 不 同类 型 污染 信息 的 认 知 态度 ， 因 此 结 
构 效 度 不 适用 于 本 研究 目的 ， 故 无 需 作 结构 效 
度 检验 。 
3.3 权重 计算 与 比较 分 析 

从 12321 中 心 获取 到 的 2014 年 2 月 至 2016 
年 10 月 各 类 污染 信息 的 统计 数据 (如 表 2 所 
示 )， 然 后 计算 3 种 权重 。 
3.3.1 客观 权重 的 计算 

先 将 附 表 中 的 数据 按照 公式 (4) 进行 标准 
化 处 理 ， 然 后 运用 公式 (5) 构造 的 实 对 称 和 矩阵 
H ( 见 表 3) ， 求 实 对 称 矩 阵 了 HH 最 大 特征 值 对 应 
的 向 量 得 客观 权重 ， 见 表 4 中 第 2 列 。 

在 7 类 梁 污 信息 中 ,“ 垃 圾 彩信 ”权重 最 大 
为 0.174， 而 骚扰 电话 权重 最 小 为 0.109， 这 
正好 与 公众 对 各 类 污染 信息 的 反感 程度 呈 反 
比 一 一 对 越 讨 大 的 污染 分 配 越 小 的 权重 ， 使 其 
得 分 越 低 。 这 也 和 我 们 的 直观 感受 一 致 ， 即 人 
们 通常 会 给 不 喜欢 的 事物 较 低 的 评价 ， 例 如 人 
们 网 购 时 ， 如 果 对 收 到 的 网 购物 品 不 满意 ， 通 
常会 就 给 予 差 评 。 

客观 权重 在 “垃圾 彩信 ”这 类 污染 信息 上 赋 
值 较 大 ， 而 在 “恶意 APP” 上 的 赋值 较 小 。 这 是 
由 于 这 两 类 污染 信息 的 举报 数量 与 其 他 类 型 的 
污染 信息 存在 数量 级 上 的 差异 ， 为 了 让 各 指标 
地 位 均等 地 参与 评价 ,“ 拉 开 档 次 法 ”对 举报 数 
量 最 多 的 “恶意 APP” 指 标 分 配 了 较 小 的 权重 ， 而 
对 举报 数量 最 少 的 垃圾 彩信 ?分 配 了 较 大 的 权重 。 
3.3.2 公众 主观 权重 的 计算 

对 问卷 信息 集结 后 计算 出 的 可 能 度 和 矩阵 P 
LK 5) 。 再 由 公式 G) 计算 出 公众 主观 权 
重 w ， 如 表 4 中 第 4 列 所 示 。 
3.3.3 综合 权重 的 计算 

将 公众 主观 权重 @ 与 标准 化 矩阵 A 加 权 
后 ， 再 利用 “ 拉 开 档次 ”法 二 次 加 权 ， 得 综合 权 
E, Ande 4 中 第 6 列 所 示 。 与 传统 “ 拉 开 档次 法 
相 比 ， 基 于 统计 数据 得 出 的 客观 权重 得 到 了 修 
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dx 2 2012 Ẹ 2 H -2016 Ẹ 10 H 12321 中 心 垃 圾 信息 举报 统计 


时 间 段 Bl B2 B3 B4 B5 B6 B7 
201402 4 875 6 278 3 713 4154 369 3 647 351311 
201403 8 229 10 953 7156 9 914 628 10 387 316318 
201404 7 801 20 891 6 303 9 972 462 11 640 341 323 
201406 7559 22 532 8 208 10 504 403 13 546 303 995 
201407 11 151 25 058 14 219 11919 317 16 431 302 723 
201408 10 563 27 236 12 035 8 761 170 15 241 345 079 
201409 9 879 30 238 8 242 8 280 181 22 476 279 247 
201410 5 010 24 075 9 655 10 061 279 27 433 232 123 
201411 7976 22 349 13 440 10 183 372 29 614 132 777 
201412 7369 21473 16 157 11 682 188 34 068 94 489 
201501 6 946 26 409 14 059 11 743 230 33 290 78 826 
201502 5 384 23 152 8 475 3677 94 12 409 94 930 
20150304 38 528 61 558 23 074 16 477 442 65 574 169 243 
201505 24 101 34 035 13 090 8317 166 31 882 66 762 
20150607 8 550 75 541 28 490 25 993 577 72 162 54 143 
201508 7 902 34 035 9 648 11 644 233 38 411 23 728 
201509 9 438 28 407 9 455 13 026 137 36 694 35 001 
201510 10 775 30 927 7923 14 262 163 39 777 24 737 
201511 11 667 25 989 7 703 11 090 158 47914 22 294 
201601 7746 29 152 6717 10 523 161 37 255 33 332 
201602 4 890 20 430 2945 3516 62 9 149 30 040 
20160506 17 415 54 164 10 906 18 662 463 69 900 90 240 
201607 6121 30 529 8 770 13 512 221 33 957 140 221 
201608 8123 31151 7 989 12 162 201 41 729 145 697 
201609 8 616 20 193 7415 11741 126 41 709 64 626 
201610 5 639 22 050 7 618 8 058 189 18 766 75 094 
ik: BI 垃圾 邮件 〈( 封 /月 ) ，B2 不 良 网 站 (个 /月 ) ，B3 垃圾 短信 (条 /月 ) ，B4 违法 短信 (条 /月 ) B5 
垃圾 彩信 〈 条 /月 ) ，B6 骚扰 电话 (起 /月 ) ，B7 恶意 APP G/H) 
表 3 仅 由 统计 数据 计算 所 得 实 对 称 矩 阵 
Bl B2 B3 B4 B5 B6 B7 
Bl 5.38E-07 1.48E-07 3.43E-07 2.75E-07 5.23E-06 1.06E-07 -1.8E-09 
B2 1.48E-07 1.28E-07 2.63E-07 3.35E-07 3.94E-06 8.56E-08 -5.3E-09 
B3 3.43E-07 2.63E-07 8.86E-07 7.TTE-07 1.32E-05 1.67E-07 -5.2E-09 
B4 2.75E-07 3.35E-07 7.TTE-07 1.28E-06 1.92E-05 2.71E-07 -1.3E-08 
B5 5.23E-06 3.94E-06 1.32E-05 1.92E-05 0.001192 1.8E-06 7.02E-07 
B6 1.06E-07 8.56E-08 1.67E-07 2.71E-07 1.8E-06 7.94E-08 -6.9E-09 
B7 -].8E-09 -5.3E-09 -5.2E-09 -].3E-08 7.02E-07 -6.9E-09 1.95E-09 
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表 4 三 种 权重 分 配 结果 对 比分 析 


mi 


污染 信息 类 型 ”客观 权重 权重 排名 


公众 主观 权重 o ”权重 排名 


综合 权重 w” ”权重 排名 


垃圾 邮件 0.004 236 1 4 0.150 129 6 4 0.004 068 0 4 
不 良 网 站 0.003 194 5 5 0.148 047 8 5 0.002 569 6 5 
垃圾 短信 0.010 7019 3 0.112 668 6 0.011 202 8 3 
违法 短信 0.015 534 2 2 0.153 208 8 2 0.015 335 9 2 
垃圾 彩信 0.964 305 6 1 0.174 132 6 1 0.964 224 5 1 
骚扰 电话 0.001 460 1 6 0.109 246 6 7 0.002 040 7 6 
恶意 APP 0.000 567 5 7 0.152 566 5 3 0.000 558 5 7 
表 5 公众 问卷 信息 模糊 区 间 标 度 可 能 度 和 矩阵 
VI V2 V3 V4 V5 V6 V7 
1 0.5 0.51247 0.7247 0.481564 0.356085 0.745207 0.485416 
2 0.48753 0.5 0.712145 0.469091 0.343652 0.732648 0.472942 
3 0.2753 0.287855 0.5 0.256691 0.131082 0.520588 0.260542 
4 0.518437 0.53091 0.743309 0.5 0.374436 0.763825 0.503856 
5 0.643915 0.656348 0.868918 0.625565 0.5 0.889399 0.629424 
6 0.254794 0.267352 0.479412 0.236175 0.110601 0.5 0.240025 
7 0.514584 0.527058 0.739458 0.496144 0.370576 0.759975 0.5 


正 ， 使 得 公众 最 讨厌 的 骚扰 电话 和 垃圾 短信 权 
重 略 有 增加 ， 公 众 诉 病 较 少 的 污染 信息 类 型 的 
权重 略 有 降低 。 除 “垃圾 短信 ”和 “恶意 APP 
权重 分 配 差 异 较 大 外 ， 其 余 类 型 的 污染 信息 所 
分 得 的 权重 比较 接近 。 即 公众 对 这 些 污染 信息 
的 直观 感受 和 12321 中 心 的 统计 数据 较为 一 致 。 
而 权重 差异 较 大 的 两 类 污染 信息 是 垃圾 短信 和 
恶意 APP。 对 于 垃圾 短信 ， 公 众 反感 程度 很 强 
烈 ， 而 在 统计 数据 上 可 能 还 存在 未 统计 到 的 部 
分 。 通 过 访谈 得 知 ， 超 过 五 成 的 公众 在 对 垃圾 
言 息 的 处 理 方式 是 直接 删除 ， 而 未 选择 举报 。 
有 些 被 调查 者 的 手机 上 虽然 安装 了 手机 卫士 , 具 
备 拦截 功能 ， 但 是 垃圾 短信 在 被 拦截 时 ， 因 为 
担心 可 能 有 短信 被 误 操作 ， 所 以 仍然 会 选择 查 
看 ， 查 看 后 也 一 般 选 择 删 除 相关 短信 。 对 于 恶 
意 APP， 权 重 分 配 差异 较 大 的 原因 仍然 是 公众 
的 直观 感受 和 统计 数据 之 间 的 差异 。 目 前 各 类 
手机 应 用 商店 都 和 12321 中 心 有 合作 ， 用 户 在 
FÆ APP 以 前 ， 大 量 恶 意 APP 已 经 被 过 滤 掉 
了 ， 所 以 公众 对 此 类 污染 信息 感知 较 少 ， 而 在 


12321 中 心 的 统计 数据 中 却 大 量 存 在 。 因 此 ， 在 
7 类 污染 信息 上 的 权重 分 配 是 合理 的 。 
3.4 评价 信息 集结 

由 于 参与 评价 的 指标 均 为 负 向 指标 《指标 
值 越 小 越 好 ， 表 示 污 染 信息 越 少 ， 也 称 成 本 型 
指标 ) ， 故 设置 正 理想 系统 为 各 指标 标准 化 后 
的 最 小 值 ， 设 置 负 理想 系统 为 各 指标 标准 化 后 
的 最 大 值 。 最 后 ， 用 2.3 节 中 的 TOPSIS 方法 集 
结 评价 信息 ， 并 将 其 放大 100 倍 ， 使 得 分 在 区 
间 [0,100] 内 ， 更 加 符合 日 党 习惯 。 得 分 越 高 表 
示 网 络 信息 污染 越 少 ， 反 之 ， 网 络 信息 污染 越 
严重 。 基 于 改进 后 的 “ 拉 开 档次 ”法 的 最 终结 果 
与 运用 传统 “ 拉 开 档次 ”法 计算 客观 权重 得 出 的 
评价 结果 对 比如 表 6 所 示 : 

表 6 左 侧 是 基于 改进 后 “ 拉 开 档次 ”法 所 得 
出 的 评价 结果 。 在 评价 时 间 段 内 , 从 整体 上 看 , 多 
数 时 段 网 络 信息 污染 状况 评分 集中 在 80 分 左 
右 ， 情 况 不 是 十 分 理想 。2016 年 1 月 和 2016 年 
8 月 评分 较 高 ， 网 络 信息 污染 相对 较 少 ， 网 络 信 
息 环境 较 好 ;得 分 最 低 的 是 2015 年 3、4 月 ， 得 
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分 仅 14.84 分 ， 其 原因 主要 是 在 这 一 时 段 内 的 信 
息 污染 可 能 较为 集中 ， 而 非 时 间 跨 度 较 大 。 这 
是 因为 2016 年 5、6 月 和 2015 年 6、7 月 同样 
时 间 跨 度 是 两 个 月 ， 得 分 却 也 与 平均 水 平 相差 
不 大 ， 反 倒是 2015 年 3、4 月 得 分 明显 偏 低 。 


表 6 改进 “ 拉 开 档 ” 法 与 传统 方法 的 评价 结果 比较 


时 间 段 改进 法 得 分 传统 法 得 分 
201601 98.80 95.70 
201408 98.22 94.73 
201610 80.77 75.62 
201402 80.75 T559 
201403 80.73 75.60 
201502 80.67 75.56 
201607 80.58 75.44 
201602 80.46 75.32 
201508 80.38 75.25 
201406 80.34 75.20 
201410 80.26 75.15 
201509 80.22 75.11 
201412 80.20 75.09 
201608 80.18 75.07 
201409 80.15 75.04 
201404 80.05 74.94 
201505 80.02 74.92 
201407 80.01 74.91 
201501 79.98 74.89 
201609 79.95 74.84 
201511 79.91 74.83 
201411 79.49 74.43 
20160506 79.377 74.33 
20150607 79.31 74.277 
201510 79.11 74.08 
20150304 14.84 19.33 


表 6 右 侧 是 基于 传统 “ 拉 开 档次 "法 对 统计 
数据 进行 最 终 排名 的 结果 。 从 两 种 评价 结果 的 
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对 比 可 以 发 现 ， 改 进 后 的 方法 得 出 的 结果 评分 
区 间 范 围 由 [19, 96] 扩大 到 [15,99]。 整 体 排名 差 
异 不 大 ， 而 2014 年 2 月 和 2014 年 3 月 的 信息 
污染 状况 排名 刚好 交换 了 顺序 。 好 的 傅 好 ， 差 
的 傅 差 ， 改进 后 的 方法 相当 于 对 被 评价 单元 作 
了 极 化 处 理 ， 这 样 能 够 更 加 明显 地 展现 出 各 时 
间 段 内 的 信息 污染 状况 。 可 见 ， 改 进 后 的 算法 
对 被 评价 单元 具有 更 好 的 区 分 能 力 。 


人 @ 结 论 与 展望 


本 文 设 计 了 公众 遭遇 信息 污染 的 态度 调查 
问卷 ， 基 于 模糊 区 间 标 度 可 能 度 对 称 和 矩阵 计算 
公众 主观 权重 ， 再 运用 “ 拉 开 档次 ”法 进行 二 次 加 
权 ， 可 以 实现 对 由 统计 数据 计算 出 的 客观 权重 
的 修正 。 运 用 改进 后 的 “ 拉 开 档次 ”法 对 2014 年 
2 月 至 2016 年 10 月 间 的 信息 污染 状况 进行 了 评 
fr. 与 传统 方法 相 比 ， 改 进 的 方法 扩大 了 评分 
区 间 ， 而 且 2014 年 2 月 和 3 月 的 评分 表现 刚好 
交换 了 位 置 。 据 此 可 以 认为 改进 后 的 方法 对 评 
价 单元 具有 更 好 的 区 分 能 力 ， 更 好 地 体现 “ 拉 开 
档次 ”的 特点 。 

相 较 以 往 研究 ， 本 文 将 公众 态度 调查 与 统 
计数 据 相 结 合 ， 更 加 全 面 地 衡量 了 当前 的 信息 
污染 状况 。 整 体 而 言 , 信息 污染 形势 相当 严峻 。 
运用 改进 后 的 “ 拉 开 档次 ”法 ， 多 数 时 间 有 段 的 评 
分 在 80 分 左右 ， 而 以 2015 年 3、4 月 的 信息 
污染 最 为 严重 。 同 时 ， 问 卷 调 查 结果 发 现 ， 公 
众 对 7 类 污染 信息 的 感知 与 中 心 的 统计 数据 间 
存在 较 大 差异 。 如 中 心 统计 数据 显示 ,“ 恶 意 
APP 举 报 数量 显著 高 于 其 他 类 型 的 污染 信息 , 但 
我 们 在 社会 调查 的 过 程 中 发 现 ， 公 众 对 “垃圾 短 
信 ?” 和 “骚扰 电话 ”最 为 反感 ， 遭 遇 恶 意 APP 的 频 
率 和 因 其 而 受到 的 损失 则 相对 较 低 。 造 成 这 一 
现象 的 原因 ， 是 公众 感知 与 统计 数据 间 存 在 差 
异 。 在 “恶意 APP” 方 面 ， 可 能 是 手机 安全 卫士 
软件 以 及 各 大 应 用 商店 的 相关 审核 措施 起 到 了 
效果 ; 而 在 垃圾 短信 方面 ， 近 五 成 公众 接收 到 
垃圾 信息 后 存在 直接 删除 的 情况 ， 导 致 部 分 垃 
圾 短信 无 法 进入 12321 中 心 统 计数 据 ， 而 公众 
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对 骚扰 电话 最 为 反感 的 原因 ， 可 能 是 因为 电话 
属于 媒介 丰富 度 较 高 的 沟通 形式 ， 因 此 驭 扰 电 
话 给 公众 造成 的 主观 印象 最 深 ,通过 回答 问卷 
的 形式 得 到 了 反映 。 此 外 ,“ 垃 圾 彩信 ”在 中 心 
统计 数据 和 公众 反映 中 都 处 于 较 低 水 平 。 随 着 
QQ、 微 信 等 即时 通讯 的 发 展 ， 彩 信 正 在 成 为 历 
史 ， 因 此 建议 将 彩信 和 与 短信 类 污染 信息 合并 统 
计 即 可 。 

本 文 也 存在 不 足 之 处 。 首 先 ， 本 文 主要 针 
对 第 一 类 网 络 信 息 污染 状况 进行 了 评价 ， 但 在 
问卷 调查 过 程 中 发 现 以 微 信 为 代表 的 社交 工具 
中 的 信息 过 载 问题 严重 ， 公 众 反 映 较 为 强烈 。 
其 次 ， 在 问卷 调查 时 ， 为 了 能 够 提高 问卷 的 可 
靠 性 ， 本 文选 择 线 上 和 线 下 两 种 渠道 回收 问 
卷 ， 其 中 线 上 问卷 受众 涉及 全 国 。 但 由 于 资源 
限制 ， 通 过 两 种 渠道 所 获得 的 样本 中 ， 重 庆 地 
区 的 人 群 比例 较 大 ， 地 区 特征 均 较为 明显 。 在 
有 条 件 的 情况 下 ， 可 以 考虑 在 全 国 范围 内 进行 
分 层 抽样 ， 使 人 群 覆盖 更 广 ， 更 具 代表 性 。 最 
后 ， 在 研究 中 仅 对 2016 年 11 月 至 12 月 期 间 
公众 遭遇 信息 污染 的 态度 进行 了 调查 。 虽 然 从 
心理 学 的 角度 来 说 ， 人 们 对 负面 信息 的 印象 更 
深 ， 持 续 的 时 间 更 长 ， 仍 建议 后 续 人 研究 可 以 每 
年 展开 一 次 社会 调研 ， 以 反映 公众 认 知 的 动态 
变化 ， 使 评价 结果 更 加 具有 实效 性 。 
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Research on the Evaluation Model for Network Pollution Status Based on Fuzzy 
Linguistic Assessments and the Scatter Degree Method 


Wan Xiaoyu, Wang Zaiyu, Jiang Ting 
School of Economics & Management, Chongqing University of Posts and Telecommunications, Chongqing 
400065 

Abstract: [Purpose/significance] Network pollution has been hated heavily by the crowd. It's essential and 
helpful to enhance the efficiency of solving this complex problem to expose it through a scientific evaluation 
way. [Method/process] Based on 417 questionnaires, a way of gaining subjective weights combined with 
fuzzy linguistic assessments was designed in this paper. In the end, the TOPSIS method was applied to gather 
the evaluation results. [Result/conclusion| From February 2014 to October 2016, the network pollution 
status was severe overall. The status of network in March & April 2015 was the worst during the whole time. 
And the improved scatter degree method in this paper can distinguish the units easier compared with the 
traditional one. 

Keywords: network information pollution scatter degree method fuzzy linguistic assessments — 12321 


center social survey 


